Detection of abusive messages in an on-line community.

Etienne Papegnies, Vincent Labatut, Richard Dufour, Georges Linarès

CORIA 2017 - Conférence en Recherche d'Informations et Applications- 14th French Information Retrieval Conference. Marseille, France, March 29-31, 2017.


RÉSUMÉ. La modération du contenu posté par les utilisateurs de communautés en ligne est majoritairement effectuée manuellement. De par la taille des données à traiter, les méthodes au- tomatiques ont un intérêt certain pour réduire la charge de travail. Actuellement, l'industrie utilise des approches basiques à base de recherche de mots, comme par exemple le filtrage des messages contenant certains mots interdits. Nous nous intéressons dans cet article à une tâche de classification permettant de déterminer si un message est abusif ou non. Ceci est com- plexe, car les messages sont écrits dans un langage naturel non standardisé. Nous proposons ici une approche originale de modération automatique appliquée au français, s'appuyant à la fois sur des outils classiques et un nouveau descripteur fondé sur la modélisation du comporte- ment utilisateur face à un message abusif. Les résultats obtenus lors de cette étude préliminaire montrent le potentiel de notre méthode, pour l'alerte automatique ou le support à la décision.

ABSTRACT. Moderating user content in online communities is mainly performed manually, and reducing the workload through automatic methods is of great interest. The industry mainly uses basic approaches such as bad words filtering. In this article, we consider the task of automati- cally determining whether a message is abusive or not. This task is complex, because messages are written in a non-standardized natural language. We propose an original automatic moder- ation method applied to French, which is based on both traditional tools and a newly proposed context-based feature relying on the modeling of user behavior when reacting to a message. The results obtained during this preliminary study show the potential of the proposed method, in a context of automatic processing or decision support.

MOTS-CLÉS : Détection d'abus, Communautés en ligne, Modération, Traitement du langage naturel

KEYWORDS : Abuse Detection, On-line Communities, Moderation, Natural Language Processing


fichier Fichier

Identifiant : doi:10.24348/coria.2017.16

Citation :

@inproceedings{coria/2017/16,
author = {Etienne Papegnies and Vincent Labatut and Richard Dufour and Georges Linarès},
title = {Detection of abusive messages in an on-line community.},
booktitle = {CORIA 2017 - Conférence en Recherche d'Informations et Applications- 14th French Information Retrieval Conference. Marseille, France, March 29-31, 2017.},
pages = {153-168},
year = {2017},
doi = {doi:10.24348/coria.2017.16}
}