ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2012
PDF

Auteurs

Olena Kummer, Jacques Savoy

Résumé

Dans cette communication, nous proposons une nouvelle méthode pour la sélection des termes et la classification automatique de sentiments. Pour déterminer les caractéristiques les plus adéquates d’une catégorie, nous nous appuyons sur le score Z. Cette mesure nous permet de définir les termes pertinents et, recourant à la mesure du gain d’information, nous pouvons également évaluer les termes dans le voisinage des termes pertinents. Sur ces deux éléments, nous proposons un nouveau modèle de classification. Notre modèle a été évalué en recourant à deux collections tests et sur la base de plusieurs représentations. La performance de notre modèle (validation croisée) s’avère égale voire supérieure à des approches connues basées sur le modèle SVM ou Naïve Bayes.

Abstract

In this article, we propose a new method for feature selection and sentiment classi- fication. To identify the most salient features belonging to the specific categories, we use the Z score measure. Based on this score, we can identify confident features and use the Infor- mation Gain (IG) measure to obtain scores for terms appearing in the neighborhood of the confident features. Based on this information, we propose a new weighting scheme to per- form sentiment classification. The proposed feature selection and classification method was evaluated on two publicly available datasets using various text representation schemes. Accuracy rates over 10 fold cross-validation indicate that the proposed approach performs on the same level, and sometimes outperforms, other schemes like SVM and Naïve Bayes.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.