ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2007
PDF

Auteurs

Laurent Gillard, Patrice Bellot, Marc El-Bèze

Résumé

Dans cet article, nous présentons une discussion sur la définition d’un score de compacité pour permettre l’extraction d’une réponse dans un système de Questions/Réponses. Ce score de compacité qui peut être succinctement décrit comme une fonction liée a la densité des termes de la question dans le voisinage d’une réponse candidate, est présenté en détail. Ensuite, une discussion nous amène à envisager une extension de ce score, initialement défini d’un point de vue positionnel, vers un modèle probabiliste ; cela afin de mieux prendre en compte des critères d’importance variable pour les mots de la question. Cette discussion est validée par des expériences où ce critère d’importance est modélisé à l’aide d’un calcul d’IDF (u Inverse Document Frequency »), et nous montrons que nous obtenons des résultats similaires à ceux obtenus lors de notre participation à la campagne d’évaluation EQueR des systèmes de Questions/Réponses.

Abstract

In this paper, we present an answer extraction algorithm based on a density (“compactness”) score for a question-answering system. This compactness score is first described from a positional point of view. Next, a discussion will bring us to envision an extension of this score towards a probabilistic model in order to better take into consideration question words importance by using theirs Inverse Document Frequencies (IDF). We experiment these positional and probabilistic compactness on a subset (composed by factual questions) of the French question answering campaign EQueR, and show that this IDF extension is worth interest.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.