Auteurs
Résumé
Dans cet article, nous présentons une première étude sur l’utilisation d’une méthode de détection des cas aberrants à base de distance pour la tâche de vérification de l’auteur. Nous avons considéré une méthode non supervisée basée sur un modèle gaussien multivarié. Pour évaluer l’efficacité de la méthode proposée, nous avons mené une expérimentation sur un corpus de textes littéraires français classiques. Nos résultats préliminaires montrent que la méthode proposée peut réaliser une haute performance de vérification qui peut atteindre un score de F1 de 83%, supérieure à celle de la méthode de référence.
Abstract
In this paper, we present a first study on using a distance-based outlier detection method for the authorship verification task. We have considered an unsupervised method based on a multivariate Gaussian model. To evaluate the effectiveness of the proposed method, we conducted experiments on a classic French corpus. Our preliminary results show that the proposed method can achieve a high verification performance that can reach an F1 score of 83% outperforming the baseline.