Auteurs
Résumé
En 2007, Naturel (Naturel, 2007) a proposé un système qui associe automatiquement une étiquette, c’est-à-dire un titre, à des émissions issues du découpage d’un flux TV. Cepen- dant, ce système ne permet pas de vérifier la correction des associations étiquette-émission. Nous proposons dans cet article de contrôler cet étiquetage en nous basant sur les transcrip- tions textuelle et phonétique de la bande sonore contenue dans le flux. Nous montrons que des méthodes de recherche d’information permettent d’associer à chaque émission une descrip- tion, issue d’un guide de programmes TV, description qui est ensuite comparée avec l’étiquette originale de l’émission. La technique proposée permet de contrôler un peu plus de 45% des émissions étudiées et de diminuer de nombre d’erreurs de l’étiquetage original de 3,5%.
Abstract
In 2007, Naturel (Naturel, 2007) developed a method which, given a segmented video stream, associated a label with each segment. However, this method did not automatically check the accuracy of the results obtained. In this paper we propose to control these results, by taking each segment, and associating the corresponding phonetic or textual transcription of the sound- track with descriptions extracted from a TV guide. Using techniques inspired from information retrieval methods, a description is linked to each segment, which can then be compared with the label associated by Naturel’s method. This new method allows us to make a decision for 45% of the segments, and to lower the original labeling error rate by 3.5%.