Data-to-Text: Vers la génération de texte à partir de données non-linguistiques

01-01-0001

Actes de CORIA 2019

PDF

Auteurs

Clément Rebuffel

Résumé

Nous nous intéressons à la problématique de la génération du langage natu- rel dont l’objectif est de transcrire un contexte d’entrée vers une description adéquate de ce contexte. Plus particulièrement, nous abordons la problématique du “data-to- text” qui se focalise sur les descriptions de données non linguistiques, comme les ta- bleaux numériques ou les graphiques. Dans ce papier, nous exposons l’état de l’art relatif à ce domaine : nous décrivons les mécanismes de base de la traduction neu- ronale automatique (NMT) qui sont les fondements des modèles de génération et les avancées récentes pour le cas particulier du “data-to-text”. Enfin, nous discutons des nouvelles problématiques dans ce domaine et présentons notre positionnement pour les prochaines recherches de thèse.

Abstract

We are interested in the issue of natural language generation, which aims to transcribe an entry context into an adequate description of this context. In particu- lar, we address the issue of data-to-text, which focuses on descriptions of non-linguistic data, such as numerical tables or graphs. In this paper, we survey the state of the art in this field: we describe the core mechanisms of automatic neural translation (NMT) which are the foundations of NLG systems and recent advances in the particular case of data-to-text. Finally, we discuss new issues in this field and present our positioning for future thesis research.

Posts Récents

Premier appel à communication - CORIA 2024

13-12-2023

Journée accès à l’information (GDR TAL)

21-09-2022

Conférence CIRCLE 2022

24-01-2022

Conférence CORIA/RJCRI 2021

01-01-2021

Groupe de lecture ARIA

06-11-2020

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.