Auteurs
Résumé
Nous nous intéressons à la problématique de la génération du langage natu- rel dont l’objectif est de transcrire un contexte d’entrée vers une description adéquate de ce contexte. Plus particulièrement, nous abordons la problématique du “data-to- text” qui se focalise sur les descriptions de données non linguistiques, comme les ta- bleaux numériques ou les graphiques. Dans ce papier, nous exposons l’état de l’art relatif à ce domaine : nous décrivons les mécanismes de base de la traduction neu- ronale automatique (NMT) qui sont les fondements des modèles de génération et les avancées récentes pour le cas particulier du “data-to-text”. Enfin, nous discutons des nouvelles problématiques dans ce domaine et présentons notre positionnement pour les prochaines recherches de thèse.
Abstract
We are interested in the issue of natural language generation, which aims to transcribe an entry context into an adequate description of this context. In particu- lar, we address the issue of data-to-text, which focuses on descriptions of non-linguistic data, such as numerical tables or graphs. In this paper, we survey the state of the art in this field: we describe the core mechanisms of automatic neural translation (NMT) which are the foundations of NLG systems and recent advances in the particular case of data-to-text. Finally, we discuss new issues in this field and present our positioning for future thesis research.