Auteurs
Résumé
Cet article présente et évalue différentes stratégies de classification automatique d’opinions. Ces dernières sont exprimées dans des phrases que le système doit classifier comme renfermant ou non une opinion. Dans ce but, nous avons retenu une classification basée sur le modèle Naïve Bayes et une autre basée sur des séparateurs à vaste marge (SVM). Comme alternative, nous suggérons un modèle basé sur le vocabulaire spécifique et le calcul d’un score normalisé (score Z). Au moyen de la collection test NCTIR, nos expériences démontrent que notre modèle apporte significativement la meilleure performance et que la représentation par des vocables s’avère préférable aux lemmes.
Abstract
This paper describes the problem of classifying opinions expressed into sentences. The system must categorize them as opinionated or factual. To achieve this objective, we have used a Naïve Bayes approach and Support Vector Machines. As a new categorization model, we suggest using a normalized score (Z score) based on a specific vocabulary. Using a NTCIR test collection, our evaluations demonstrate that the suggested model based on the Z score performs significantly better than the others and that a representation based on words tends to show better performance level than surrogates based on lemmas.