Auteurs
Résumé
L’identification du locuteur est la tâche qui consiste à associer un locuteur à chaque tour de parole d’un dialogue, utilisée notamment pour enrichir les corpus de transcriptions automatiques.Le traitement de la tâche peut totalement différer selon le média : vidéo (films, séries, etc.), audio (séries, radio, etc.) ou textuel (scripts, transcriptions, etc.). Dans cet article, nous proposons une méthode d’identification du locuteur à partir des scripts et transcriptions de séries. Dans un dialogue de série, il est courant que les personnages mentionnent le nom des autres personnages à travers les discussions. Ces mentions peuvent servir d’indices afin d’identifier les locuteurs des tours de parole par leur nom. Nous proposons donc une approche d’identification du locuteur neuronale fondée sur la propagation des mentions à travers le dia- logue. Cette approche parvient à trouver correctement le locuteur de 34% tours de parole pour la série The Big Bang Theory, et 34% pour la série Friends.
Abstract
Speaker identification consists in matching a speaker for each speech turn of a given dialog. Its main use is to enhance automatic transcripts corpus.The task can differ totally from a media to another: video (movies, series, etc.), audio (series, radio, etc.) or textual (scripts, transcripts, etc.). In this paper, we propose a speaker identification method for scripts and transcripts of series. In series dialogs, characters usually mention other characters names. These mentions can be used to identify speakers by their names. We present a neuronal speaker identification approach based on mentions propagation along dialogs. We successfully identify speakers for 34% of speech turns for The Big Bang Theory’s script, and 34% for Friends.