ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2005
PDF

Auteurs

Thierry Delbecque, Pierre Jacquemart, Pierre Zweigenbaum

Résumé

Les entités nommées (EN) sont des objets importants pour les systèmes de Questions- Réponses (QR). Cependant, les types d’EN habituels couvrent des concepts très généraux : dates, lieux géographiques, noms de personnes, etc. Pour un système de QR dédié à la méde- cine, il serait utile de disposer de types plus spécifiques. Une hiérarchie de types de concepts médicaux est définie dans l’UMLS, une grande base terminologique médicale produite par la NLM. Nous tentons d’évaluer l’utilisabilité de l’UMLS, dans sa partie francophone, comme source de telles entités. Nous réalisons un étiquetage d’un corpus médical par les concepts de l’UMLS et leurs types sémantiques. Puis nous montrons, à travers une étude statistique que les modalités de mise en oeuvre de ces nouveaux types d’EN doivent prendre en compte l’origine individuelle des documents explorés lors d’une tâche de QR.

Abstract

Named Entities are important concepts, regarding Question-Answering (QA) sys- tems. Nevertheless, Named Entities categories are usually defined in a very broad sense: date, geographical area, and so on. It should quite profitable, for medical QA systems, to benefit from Named Entities especially dedicated to medicine. The UMLS is an important terminologi- cal tool created and maintained by the NLM; it comes along with a hierarchical organization of medical concepts. This paper is an attempt to evaluate the French part of UMLS as a resource for a medical-specific Named Entity tagger. We have tagged a set of medical documents, and have shown, using statistical studies that strategies using these new tags in a QA context are to take in account the individual origin of each document.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.