ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2012
PDF

Auteurs

Asma Ben Abacha, Pierre Zweigenbaum

Résumé

La conception des systèmes de questions-réponses nécessite une analyse profonde des questions posées. Cette tâche primordiale requiert d’être étudiée et évaluée séparément. Dans cet article, nous nous intéressons à l’analyse de questions en domaine médical. Plus pré- cisément, nous étudions la transformation de questions posées en langage naturel en requêtes basées sur un langage formel. Cette étude examine trois points clés : (i) Quelles sont les car- actéristiques d’une question médicale, (ii) Quelles sont les méthodes les mieux adaptées pour l’extraction des informations utiles et (iii) Comment transformer les informations extraites en une représentation formelle. Nous présentons une approche sémantique comportant la recon- naissance des entités médicales, l’extraction de relations sémantiques et la transformation au- tomatique de la question en requête(s) SPARQL. Notre étude supporte l’hypothèse que SPARQL peut représenter de nombreux types de questions. Les résultats obtenus sur un corpus de ques- tions réelles montrent que les requêtes SPARQL sont correctes pour 62 % des questions. Ces résultats dépendent fortement de la couverture des relations traitées. Si les systèmes d’extrac- tion d’information sont fiables, SPARQL peut représenter correctement 98 % des questions du corpus d’évaluation.

Abstract

In this paper we tackle question analysis in the medical domain. More precisely, we study how to translate a natural language question into a machine-readable representation. The underlying transformation process requires determining three key points: (i) What are the main characteristics of medical questions? (ii) Which methods are the most suited to extract these characteristics? and (iii) how to translate the extracted information into a machine- readable representation? We present a complete question analysis approach including medical entity recognition, relation extraction and automatic translation to SPARQL queries. Our study supports the claim that SPARQL can represent a wide range of natural language questions.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.