Évaluation de modèles de classification automatique appliqués à la détection d'opinions.

01-01-0001

Actes de CORIA 2010

PDF

Auteurs

Olena Zubaryeva, Jacques Savoy

Résumé

Cet article présente et évalue différentes stratégies de classification automatique d’opinions. Ces dernières sont exprimées dans des phrases que le système doit classifier comme renfermant ou non une opinion. Dans ce but, nous avons retenu une classification basée sur le modèle Naïve Bayes et une autre basée sur des séparateurs à vaste marge (SVM). Comme alternative, nous suggérons un modèle basé sur le vocabulaire spécifique et le calcul d’un score normalisé (score Z). Au moyen de la collection test NCTIR, nos expériences démontrent que notre modèle apporte significativement la meilleure performance et que la représentation par des vocables s’avère préférable aux lemmes.

Abstract

This paper describes the problem of classifying opinions expressed into sentences. The system must categorize them as opinionated or factual. To achieve this objective, we have used a Naïve Bayes approach and Support Vector Machines. As a new categorization model, we suggest using a normalized score (Z score) based on a specific vocabulary. Using a NTCIR test collection, our evaluations demonstrate that the suggested model based on the Z score performs significantly better than the others and that a representation based on words tends to show better performance level than surrogates based on lemmas.

Posts Récents

Premier appel à communication - CORIA 2024

13-12-2023

Journée accès à l’information (GDR TAL)

21-09-2022

Conférence CIRCLE 2022

24-01-2022

Conférence CORIA/RJCRI 2021

01-01-2021

Groupe de lecture ARIA

06-11-2020

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.