ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2013
PDF

Auteurs

Morgane Marchand

Résumé

La manière dont les gens expriment leur avis change selon ce dont ils parlent. Ainsi, un classifieur d’opinion entraîné sur des critiques de films, ne pourra pas être appliqué à des critiques de restaurants sans un minimum d’adaptation. Par exemple, certains mots présents dans les deux domaines peuvent changer de polarité. Dans cet article, nous montrons dans un premier temps que ces mots changeant de polarité affectent le comportement des classifieurs automatiques d’opinion : supprimer ces mots des corpus ou bien les considérer comme deux mots différents améliore les résultats des classifieurs. Dans un second temps, nous présentons une méthode exploratoire permettant de détecter automatiquement ces mots qui changent de polarité, sans avoir recours aux annotations du domaine cible. Cette méthode s’appuie sur la comparaison des profils de co-occurrence des mots dans les deux domaines par rapport à un ensemble de mots pivots, sélectionnés automatiquement pour n’avoir qu’une seule polarité.

Abstract

Sentiment is expressed differently in different domains. For instance, words which are used in both domains can change their polarity. In this article, we present a study on these multi-polarity words. We first show that these multi-polarity words are actually used by automatic opinion classifiers and affect their performances: the classification performance improves if the multi-polarity words are considered as two different words, or even suppressed from the representation. In a second part, we present an exploratory method for multi-polarity words detection without any labelled target data. This method relies on the comparison of the co-occurrence profiles of the words with a set of pivot words, selected to have only one polarity.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.