Classification de questions par traduction.

01-01-0001

Actes de CORIA 2013

PDF

Auteurs

Anne-Laure Ligozat

Résumé

Dans cet article, nous nous intéressons à la classification de questions pour un système de questions-réponses en français. Faisant le constat d’un manque de corpus annoté en français, nous nous interrogeons sur la possibilité d’exploiter les corpus anglais existants, en utilisant des traducteurs automatiques. Nous avons mené une série d’expériences en faisant varier le sens de traduction des corpus et les attributs fournis au classifieur. Les résultats mon- trent qu’il est possible de s’approcher des performances monolingues en traduisant le corpus d’apprentissage.

Abstract

In this paper, we focus on question classification for a French question answering system. Since there are no annotated corpus for French, we investigated exploiting the existing corpora for English, by using machine translation tools. We conducted a series of experiments varying the translated corpora and the features given to the classifier. Results show that it is possible to obtain an accuracy close the monolingual one by translating the training corpus.

Posts Récents

Premier appel à communication - CORIA 2024

13-12-2023

Journée accès à l’information (GDR TAL)

21-09-2022

Conférence CIRCLE 2022

24-01-2022

Conférence CORIA/RJCRI 2021

01-01-2021

Groupe de lecture ARIA

06-11-2020

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.