ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2010
PDF

Auteurs

Olena Zubaryeva, Jacques Savoy

Résumé

Cet article présente et évalue différentes stratégies de classification automatique d’opinions. Ces dernières sont exprimées dans des phrases que le système doit classifier comme renfermant ou non une opinion. Dans ce but, nous avons retenu une classification basée sur le modèle Naïve Bayes et une autre basée sur des séparateurs à vaste marge (SVM). Comme alternative, nous suggérons un modèle basé sur le vocabulaire spécifique et le calcul d’un score normalisé (score Z). Au moyen de la collection test NCTIR, nos expériences démontrent que notre modèle apporte significativement la meilleure performance et que la représentation par des vocables s’avère préférable aux lemmes.

Abstract

This paper describes the problem of classifying opinions expressed into sentences. The system must categorize them as opinionated or factual. To achieve this objective, we have used a Naïve Bayes approach and Support Vector Machines. As a new categorization model, we suggest using a normalized score (Z score) based on a specific vocabulary. Using a NTCIR test collection, our evaluations demonstrate that the suggested model based on the Z score performs significantly better than the others and that a representation based on words tends to show better performance level than surrogates based on lemmas.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.