Auteurs
Résumé
Les techniques traditionnelles de recherche d’information montrent des limites pour extraire certaines réponses précises contenues dans des documents. Cet article présente une méthode de recherche d’informations adaptée au contexte d’un système de question-réponse oral interactif en domaine ouvert. Cette méthode vise à améliorer la sélection des meilleures réponses. Nous proposons une approche consistant à mesurer un coût de transformation entre deux arbres textuels qui rend compte des reformulations possibles entre un texte décrivant l’in- formation recherchée (question) et un passage de document. Nous présentons ensuite une éva- luation de la méthode sur le corpus Clef et analysons les résultats mesurés. Nos perspectives présentent des voies d’amélioration et incluent l’exploitation des transformations d’arbres trou- vées par notre méthode pour fournir des informations à l’utilisateur sur le déroulement de la recherche.
Abstract
Traditionnal Information Retrieval techniques have some limitations when it comes to extracting accurate answers from documents. This paper describes an information retrieval method working in the context of a speech-based, open domain interactive question-answer system. The goal is to improve the selection of the best answers. We present an approach which aims to compute a transformation cost between two textuals trees. This computation uses reformulation paths between a text which describes the information (question) and an extract from a document. We then present a first evaluation of our method on the Clef corpus. We analyze the results and suggest some possible improvements, including the use of the tree transformations to give the user some information on how the answer was extracted.