ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2017
PDF

Auteurs

Amal Htait, Sébastien Fournier, Patrice Bellot

Résumé

Dans le but d’exploiter les opinions dans les tweets, cet article présente une classification à partir du sentiment contenu au sein des tweets. Nous présentons une méthode d’identifi- cation de nouveaux mots-germes. Ils sont utilisés pour la prédiction de l’intensité de sentiments des mots en co-occurrence avec ces mots-germes. Ensuite, le calcul de similarités entre sen- timents est appliqué en utilisant: la mesure de la similarité entre deux mots et l’utilisation de plongement de mots (e.g. word2vec, GloVE) couplé à la mesure cosinus. Les résultats montrent l’importance de l’utilisation de mots-germes adaptés aux tweets, ainsi que la taille et le prétrai- tement de corpus. Pour conclure, nous avons obtenu les meilleurs résultats grâce à l’application de la méthode utilisant le plongement de mots couplée à la mesure cosinus.

Abstract

For the purpose of opinion exploring in tweets, this article presents a sentiment classification of tweets content. First, we present a method to identify new sentiment similarity seed words. These seed words are used for predicting sentiment intensity of other words and short phrases in co-occurrence. Then, for testing sentiment similarity, we use: Similarity Measures methods between words and cosine similarity measure between the word embedding represen- tations (e.g. word2vec, GloVE). The experiments results highlight the importance of adapted for tweets seed words. In addition of the corpora size and its pre-treatement. As a conclusion, best results were achieved using cosine similarity measure between the word embedding representations.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.