ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2019
PDF

Auteurs

Léo Galmant, Hervé Bredin, Camille Guinaudeau, Anne-Laure Ligozat

Résumé

L’identification du locuteur est la tâche qui consiste à associer un locuteur à chaque tour de parole d’un dialogue, utilisée notamment pour enrichir les corpus de transcriptions automatiques.Le traitement de la tâche peut totalement différer selon le média : vidéo (films, séries, etc.), audio (séries, radio, etc.) ou textuel (scripts, transcriptions, etc.). Dans cet article, nous proposons une méthode d’identification du locuteur à partir des scripts et transcriptions de séries. Dans un dialogue de série, il est courant que les personnages mentionnent le nom des autres personnages à travers les discussions. Ces mentions peuvent servir d’indices afin d’identifier les locuteurs des tours de parole par leur nom. Nous proposons donc une approche d’identification du locuteur neuronale fondée sur la propagation des mentions à travers le dia- logue. Cette approche parvient à trouver correctement le locuteur de 34% tours de parole pour la série The Big Bang Theory, et 34% pour la série Friends.

Abstract

Speaker identification consists in matching a speaker for each speech turn of a given dialog. Its main use is to enhance automatic transcripts corpus.The task can differ totally from a media to another: video (movies, series, etc.), audio (series, radio, etc.) or textual (scripts, transcripts, etc.). In this paper, we propose a speaker identification method for scripts and transcripts of series. In series dialogs, characters usually mention other characters names. These mentions can be used to identify speakers by their names. We present a neuronal speaker identification approach based on mentions propagation along dialogs. We successfully identify speakers for 34% of speech turns for The Big Bang Theory’s script, and 34% for Friends.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.