ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2010
PDF

Auteurs

Ali Harb, Jean-Jacques Girardot, Michel Beigbeder

Résumé

Fournir de bonnes réponses à une question donnée en cherchant au sein d’un grand corpus de documents est une tâche difficile. Il est nécessaire de percevoir et de reconnaître la question à un niveau qui permet d’imposer des contraintes sur l’ensemble des réponses pos- sibles. Une contrainte fréquemment utilisée est la catégorie des questions qui permet de déduire le type de réponse attendue. L’objectif est de fournir des informations supplémentaires afin de réduire l’écart entre la question et sa réponse. Nous proposons ici une approche pour amélio- rer l’efficacité des classifieurs, basée sur l’analyse linguistique et des approches statistiques. Ce travail propose également deux méthodes d’expansion des questions. Pour cela, différentes caractéristiques pour la représentation des questions, différentes pondérations et plusieurs al- gorithmes d’apprentissage automatique ont été étudiés. Les expériences menées sur des jeux de données réels montrent une amélioration de la précision dans la classification des questions.

Abstract

Responding correctly to a question given a large collection of textual data is not an easy task. There is a need to perceive and recognize the question at a level that permits to detect some constraints that the question imposes on possible answers. The question classification task is used in Question Answering systems. This deduces the type of the expected answer, to perform a semantic classification to the target answer. The purpose is to provide additional information to reduce the gap between answer and question. An approach to improve the effectiveness of classifiers focusing on linguistic analysis and statistical approaches. This work also proposes two methods of questions expansion. Various questions representation, term weighting and diverse machine learning algorithms are studied. Experiments conducted on actual data are presented. Of interest is the improvement in the precision on the classification of questions.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.