Auteurs
Résumé
Les plateformes sociales (Twitter, blogs, forums), vecteurs de la diversité des points de vue de la collectivité, constituent un vivier de données convoité pour la fouille d’opinion et l’analyse de sentiments. Dans ce cadre, les méthodes appliquées en classification n’apprennent souvent que des sorties relativement frustes : celles-ci se réduisent à une polarité ou à une gradation linéaire. Est-il possible d’apprendre des motifs plus riches avec un nombre raison- nable d’exemples ? Notre démarche est appliquée au ressenti à l’égard de marques. L’enjeu est d’analyser l’image de marque à l’aide d’un ensemble de traits lexicaux, structurés par leurs relations sémantiques. Pour prédire un tel motif par apprentissage supervisé, il est avant tout nécessaire de disposer d’un jeu de données étiquetées. Pour cela, nous avons mis en place une plateforme collaborative pour l’étiquetage de messages issus du web social en traits séman- tiques et sentiments. Afin d’optimiser les étiquetages, la plateforme est sous-tendue par des mécanismes dynamiques à double vocation : filtrer les messages non pertinents et restructurer la grille d’analyse spécifique à chaque marque au fur et à mesure des annotations.
Abstract
Social networks mirror public opinion. Thus, they are of great interest for opinion mining and sentiment analysis. In most cases, sentiment is classified according to a polarity cri- terion or a linear gradation. Is it possible to learn more complex patterns with limited itemsets? In this article, we investigate brand equity. The goal is to analyze how social groups perceive a given brand. Brand identity is described with a structured set of adjectives, considered as se- mantic features. Since supervised pattern recognition requires labeled datasets, a platform was set up for social networks sentiment analysis. The platform relies on collaborative and dynamic principles designed to relevance-based filtering and semantic features reconfiguration.