ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA-TALN 2018
PDF

Auteurs

Rémi Cardon

Résumé

otre travail traite de la simplification automatique de textes. Ce type d’application vise à rendre des contenus difficiles à comprendre plus lisibles. À partir de trois corpus comparables du domaine médical, d’un lexique existant et d’une terminologie du domaine, nous procédons à des analyses et à des modifications en vue de la simplification lexicale de textes médicaux. L’alignement manuel des phrases provenant de ces corpus comparables fournit des données de référence et permet d’analyser les procédés de simplification mis en place. La substitution lexicale avec la ressource existante permet d’effectuer de premiers tests de simplification lexicale et indique que des ressources plus spécifiques sont nécessaires pour traiter les textes médicaux. L’évaluation des substitutions est effectuée avec trois critères : grammaticalité, simplification et sémantique. Elle indique que la grammaticalité est plutôt bien sauvegardée, alors que la sémantique et la simplicité sont plus difficiles à gérer lors des substitutions avec ce type de méthodes.

Abstract

exical approach for the automatic simplification of medical texts Our work addresses the automatic text simplification. This kind of application aims at improving the readability of texts that are difficult to read. Using three different corpora u which contain biomedical texts u an existing lexicon and a domain terminology, we perform analysis and modification of texts in order to achieve their lexical simplification. Manual alignment of sentences from comparable corpora provides reference data and permits to analyze the simplification procedures involved. Lexical substitution using existing resources permits to perform first tests of lexical simplification and indicates that specific resources are necessary when working with medical contents. The evaluation of substitutions is performed through three criteria : grammaticality, simplicity and semantics. It indicates that grammaticality is rather well preserved, while semantics and simplicity are more difficult to handle during the substitutions with this kind of methods.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.