Auteurs
Résumé
Dans cet article, nous présentons une discussion sur la définition d’un score de compacité pour permettre l’extraction d’une réponse dans un système de Questions/Réponses. Ce score de compacité qui peut être succinctement décrit comme une fonction liée a la densité des termes de la question dans le voisinage d’une réponse candidate, est présenté en détail. Ensuite, une discussion nous amène à envisager une extension de ce score, initialement défini d’un point de vue positionnel, vers un modèle probabiliste ; cela afin de mieux prendre en compte des critères d’importance variable pour les mots de la question. Cette discussion est validée par des expériences où ce critère d’importance est modélisé à l’aide d’un calcul d’IDF (u Inverse Document Frequency »), et nous montrons que nous obtenons des résultats similaires à ceux obtenus lors de notre participation à la campagne d’évaluation EQueR des systèmes de Questions/Réponses.
Abstract
In this paper, we present an answer extraction algorithm based on a density (“compactness”) score for a question-answering system. This compactness score is first described from a positional point of view. Next, a discussion will bring us to envision an extension of this score towards a probabilistic model in order to better take into consideration question words importance by using theirs Inverse Document Frequencies (IDF). We experiment these positional and probabilistic compactness on a subset (composed by factual questions) of the French question answering campaign EQueR, and show that this IDF extension is worth interest.